Смешанные частные производные одной и той же функции, отличающиеся лишь порядком (очерёдностью) дифференцирования, равны между собой при условии их непрерывности. Такое свойство называется равенством смешанных производных.
Само утверждение о равенстве смешанных производных в различных источниках упоминается как теорема Шварца, теорема Клеро или теорема Янга.
Пусть дана достаточно гладкая (скалярная) функция
многих переменных:
![{\displaystyle (1)\qquad f=f(x_{1},x_{2},\dots x_{n})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f7d6f7bc0f80ca97714b2d80d5809b269eaf863d)
Мы можем взять частную производную этой функции по одному из аргументов
, считая остальные аргументы постоянными параметрами. В результате мы получим новую функцию:
![{\displaystyle (2)\qquad \phi (x_{i})={\partial f \over \partial x_{i}}{\bigg |}_{x_{1},\dots x_{i-1},x_{i+1},\dots x_{n}=const}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/151053da5d7b6c29e4924595d7315e8595083b82)
Эта новая функция тоже зависит от остальных аргументов как от параметров. То есть численное значение
в общем случае зависит от тех же переменных
, что и оригинальная функция
:
![{\displaystyle (3)\qquad \phi =\phi (x_{1},x_{2},\dots x_{n})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c91fe8a65de6ae71d054ec083803cae4fe771862)
Если функция
окажется достаточно гладкой, то мы можем и её продифференцировать, взяв частную производную по тому же самому или по другому аргументу
:
![{\displaystyle (4)\qquad {\partial \phi \over \partial x_{j}}={\partial ^{2}f \over \partial x_{j}\partial x_{i}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/68308a6c7da19c02882e8613d2f5ad0f6541ee7d)
Если
, то выражение в правой части равенства (4) называется смешанной производной.
Для гладкой функции многих переменных значение смешанной производной не зависит от порядка дифференцирования:
![{\displaystyle (5)\qquad {\partial ^{2}f \over \partial x_{i}\partial x_{j}}={\partial ^{2}f \over \partial x_{j}\partial x_{i}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7a66f316a8cdc18731f7052d8120cf976c448cf8)
Теорема является базовой в теории функций многих переменных и широко применяется в математической физике, теории дифференциальных уравнений в частных производных, дифференциальной геометрии.
Уточнять необходимую степень гладкости следует поэтапно.
- 1. Справедливость для аналитической функции (теорема).
- 2. Справедливость для более широкого класса функций, имеющих в окрестности точки только такие непрерывные производные:
![{\displaystyle (6)\qquad {\partial f \over \partial x_{i}},\;{\partial f \over \partial x_{j}},\;{\partial ^{2}f \over \partial x_{i}\partial x_{j}},{\partial ^{2}f \over \partial x_{j}\partial x_{i}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b90394602f1baf271f81d2cb26af49c5d6949676)
- 3. Поскольку для фиксированных индексов
все производные из перечня (6) берутся при условии, что любой третий аргумент
является константой, то функция
(а также все производные (6)) может быть разрывной в отношении третьих аргументов. Например, составим функцию из двух слагаемых:
![{\displaystyle f(x_{1},x_{2},\dots x_{n})=\Phi (x_{i},x_{j})+Z(\dots x_{i-1},x_{i+1},\dots x_{j-1},x_{j+1},\dots )}](https://wikimedia.org/api/rest_v1/media/math/render/svg/62d3e281a58aca040f26a331cddaa26aa72f27a2)
где первое слагаемое является гладкой функцией двух аргументов, а второе слагаемое разрывной во всех точках.
Дальнейшее уточнение гладкости функции нужно делать в ходе доказательства теоремы, оно будет сформулировано в самом конце.
Как указано выше, для доказательства теоремы можно не рассматривать зависимость функции от третьих аргументов. Поэтому для простоты записи изменим обозначения
на
, то есть будем рассматривать такую функцию двух переменных:
![{\displaystyle (7)\qquad f=f(x,y)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5269f65de989bd9a3c07f4fda0ce26d4098b0c9b)
Также для упрощения формул будем обозначать частные производные индексами внизу функции:
![{\displaystyle (8)\qquad f_{x}(x,y)={\partial f(x,y) \over \partial x},\;f_{y}(x,y)={\partial f(x,y) \over \partial y}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e6a8b73cc076ca09712dfe33b992bb602ce91315)
![{\displaystyle (8a)\qquad f_{xy}={\partial ^{2}f \over \partial x\partial y},\;f_{yx}={\partial ^{2}f \over \partial y\partial x}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/33aa0414ae312cfd7b4ef326e9058064a23d7c6d)
Пусть в точке
существует смешанная производная:
![{\displaystyle (9)\qquad f_{xy}(x,y)=\lim _{\Delta x\rightarrow 0}{f_{y}(x+\Delta x,y)-f_{y}(x,y) \over \Delta x}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/12dd523e08b5a05089fcf4c5f963b41bf48f469d)
Предположим, что смешанная производная
существует в точке
, а также существует первая производная
вдоль (горизонтальной) прямой
.
Далее, разность производных равна производной от разности, поэтому превращаем формулу (9) в:
![{\displaystyle (10)\qquad f_{xy}(x,y)=\lim _{\Delta x\rightarrow 0}{1 \over \Delta x}{\partial \over \partial y}\left[f(x+\Delta x,y)-f(x,y)\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d827c269734f6fa55c72df9b9f84ec8940847da7)
Это преобразование никаких дополнительных условий не накладывает, поскольку разность дифференцируемых функций всегда является функцией дифференцируемой.
Далее, разность в квадратных скобках формулы (10) можно записать в виде определённого интеграла от производной:
![{\displaystyle (11)\qquad f_{xy}(x,y)=\lim _{\Delta x\rightarrow 0}{1 \over \Delta x}{\partial \over \partial y}\int _{x}^{x+\Delta x}f_{x}(\xi ,y)d\xi }](https://wikimedia.org/api/rest_v1/media/math/render/svg/60cc7de9fd1d4d1ff81b4df614906be17f281c63)
Нужно, чтобы существовала частная производная
вдоль прямой
.
Теперь частную производную по игрек в формуле (11) запишем согласно определению производной как предела:
![{\displaystyle (12)\qquad f_{xy}(x,y)=\lim _{\Delta x\rightarrow 0}{1 \over \Delta x}\lim _{\Delta y\rightarrow 0}{1 \over \Delta y}\left(\int _{x}^{x+\Delta x}f_{x}(\xi ,y+\Delta y)d\xi -\int _{x}^{x+\Delta x}f_{x}(\xi ,y)d\xi \right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ddf603cb907bfa0f41ef06bcd48d23d8d5f36d8a)
Как видно, надо, чтобы частная производная
существовала не только на прямой
, но в некоторой двухмерной окрестности точки
.
Далее, разность интегралов равна интегралу от разности, причём под знак интеграла можно внести постоянный множитель
:
![{\displaystyle (13)\qquad f_{xy}=\lim _{\Delta x\rightarrow 0}{1 \over \Delta x}\lim _{\Delta y\rightarrow 0}\int _{x}^{x+\Delta x}{f_{x}(\xi ,y+\Delta y)-f_{x}(\xi ,y) \over \Delta y}d\xi }](https://wikimedia.org/api/rest_v1/media/math/render/svg/6e14ec62fd9bc6a5a853b5c779ccd79ca79cb1e1)
Это преобразование также не накладывает дополнительных условий, поскольку разность интегрируемых функций является функцией интегрируемой.
По теореме Лагранжа, подынтегральное выражение в формуле (13) равно производной в средней точке:
![{\displaystyle (14)\qquad {f_{x}(\xi ,y+\Delta y)-f_{x}(\xi ,y) \over \Delta y}=f_{yx}(\xi ,\eta )}](https://wikimedia.org/api/rest_v1/media/math/render/svg/79087ff08567be1548c1e1541dd1afb74e4b912c)
Средняя точка является функцией:
,
значения которой лежат в интервале (если, например,
)
![{\displaystyle (14b)\qquad \eta \in \,[y,y+\Delta y]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ab4f45c90c86829bb514e1daaccf520cc5a000ce)
Для справедливости (14) нужно существование смешанной производной
в некоторой двухмерной окрестности точки
.
Для окончания доказательства надо принять, что смешанная производная непрерывна в точке
как функция двух переменных. Значение этой производной в близкой точке
равно с точностью до бесконечно малого слагаемого значению производной в точке
:
![{\displaystyle (15)\qquad f_{yx}(\xi ,\eta )=f_{yx}(x,y)+o(\xi -x,\eta -y)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0109b855bb0b4d139edb1fd888db1cc7357c9d0f)
Смешанная производная
существует в двухмерной окрестности точки
и непрерывна в этой точке как функция двух переменных.
Подставим (14) и (15) в (13):
![{\displaystyle (16)\qquad f_{xy}=\lim _{\Delta x\rightarrow 0}{1 \over \Delta x}\lim _{\Delta y\rightarrow 0}\int _{x}^{x+\Delta x}(f_{yx}(x,y)+o(\xi -x,\eta -y))d\xi }](https://wikimedia.org/api/rest_v1/media/math/render/svg/58cfb4ad8d99bfd4541f25ef0237b9d3aaa2c4e4)
Заметим, что формула (16) эквивалентна формуле (13) (хотя и в других обозначениях), а потому интеграл и обе границы существуют. Поскольку подынтегральная функция в (16) интегрируема, а первое слагаемое
является константой по переменной интегрирования
, то второе слагаемое тоже оказывается интегрируемым, и мы можем разбить интеграл на сумму двух интегралов, первый из которых легко берётся как интеграл от константы:
![{\displaystyle (17)\qquad \int _{x}^{x+\Delta x}(f_{yx}(x,y)+o(\xi -x,\eta -y))d\xi =\int _{x}^{x+\Delta x}f_{yx}(x,y)d\xi +\int _{x}^{x+\Delta x}o(\xi -x,\eta -y)d\xi =}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a849b12c39c88f4e91db685a53ad603423b1c492)
![{\displaystyle =f_{yx}\Delta x+\int _{x}^{x+\Delta x}o(\xi -x,\eta -y)d\xi }](https://wikimedia.org/api/rest_v1/media/math/render/svg/3fa3ab8130d17f9bd61fc35d040808320f6a853b)
После подстановки (17) в (16) мы можем вынести постоянное слагаемое сначала за пределы первой границы, а затем за пределы другой границы:
![{\displaystyle (18)\qquad f_{xy}=\lim _{\Delta x\rightarrow 0}{1 \over \Delta x}\left(f_{yx}(x,y)\Delta x+\lim _{\Delta y\rightarrow 0}\int _{x}^{x+\Delta x}o(\xi -x,\eta (\xi ,\Delta y)-y)d\xi \right)=}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b25ed1ef4073acf44251e739013e69b5e710e99c)
![{\displaystyle =f_{yx}(x,y)+\lim _{\Delta x\rightarrow 0}{1 \over \Delta x}\lim _{\Delta y\rightarrow 0}\int _{x}^{x+\Delta x}o(\xi -x,\eta (\xi ,\Delta y)-y)d\xi }](https://wikimedia.org/api/rest_v1/media/math/render/svg/c92272304840b21e9ee1b0056d79cd46cb6a1a05)
Покажем, что второе слагаемое в последнем выражении формулы (18) равно нулю. Возьмём произвольное положительное число
. Непрерывность смешанной производной
в точке
означает, что существует такое положительное число
, что для каждой точки
внутри квадрата
справедливо неравенство:
![{\displaystyle (19)\qquad |o(\xi -x,\eta -y)|=|f_{yx}(\xi ,\eta )-f_{yx}(x,y)|<\epsilon }](https://wikimedia.org/api/rest_v1/media/math/render/svg/1ffd8c6cb7ddcb65a8a6d9cd70adf8aa4260bed3)
Если мы возьмём положительные числа
, то интеграл в последнем слагаемом формулы (18) оценивается сверху:
![{\displaystyle (20)\qquad \int _{x}^{x+\Delta x}o(\xi -x,\eta (\xi ,\Delta y)-y)d\xi <\int _{x}^{x+\Delta x}\epsilon d\xi =\epsilon \Delta x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b459e3663fc227a8cd18b971131a2b29eca13037)
Обозначим это слагаемое
![{\displaystyle (21)\qquad L=\lim _{\Delta x\rightarrow 0}{1 \over \Delta x}\lim _{\Delta y\rightarrow 0}\int _{x}^{x+\Delta x}o(\xi -x,\eta (\xi ,\Delta y)-y)d\xi \leq \lim _{\Delta x\rightarrow 0}{1 \over \Delta x}\lim _{\Delta y\rightarrow 0}\epsilon \Delta x=\epsilon }](https://wikimedia.org/api/rest_v1/media/math/render/svg/23df081448b1ac1a09b4c023783817524ac73f2d)
Аналогично (если взять
), имеем оценку снизу:
![{\displaystyle (22)\qquad L\geq -\epsilon }](https://wikimedia.org/api/rest_v1/media/math/render/svg/af9e8786a7b4ab3ce5cd98f1dde7935bd50d9347)
Поскольку положительное число
может быть сколь угодно малым, то с необходимостью следует
. Теорема доказана.
Как видно в ходе доказательства, от функции требуется существование одной смешанной производной (например,
) в точке, а также существование второй смешанной производной
в двумерной окрестности точки и её непрерывность в этой точке. Из этого условия также следует существование производной
вдоль отрезка прямой
и существование производной
в двумерной окрестности точки.
Кроме того, существование
в точке
следует из двух фактов: (а) существует производная
вдоль отрезка прямой
, проходящей через точку
, (б) смешанная производная
существует и непрерывна в этой точке.
Рассмотрим функцию
![{\displaystyle (23)\qquad f(x,y)=xy+y^{2}\chi (y)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cc1e3f796a1333cc31591ac09c9da7db681ffdf8)
где функция Дирихле
равна нулю в рациональных точках
и единице в иррациональных. Функция (23) определена на всей плоскости; непрерывна (как функция двух переменных) вдоль прямой
и разрывна во всех других точках плоскости.
Везде существует непрерывная частная производная:
![{\displaystyle (24)\qquad f_{x}(x,y)={\partial f \over \partial x}=y}](https://wikimedia.org/api/rest_v1/media/math/render/svg/39b53fb398ad7ec0e0709e41232722a0f71b8bfc)
а также одна из смешанных производных:
![{\displaystyle (25)\qquad f_{yx}(x,y)={\partial ^{2}f \over \partial y\partial x}=1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1113866f167cddd77d1a0f7c54a4de8f6eddc36d)
Частная производная по игрек существует лишь в точках прямой
:
![{\displaystyle (26)\qquad f_{y}(x,0)=x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/da565019b8cec1511f9383e55840ecb51e289d73)
Также в этих же точках прямой существует вторая смешанная производная:
![{\displaystyle (27)\qquad f_{xy}(x,0)=\lim _{\Delta x\rightarrow 0}{f_{y}(x+\Delta x,0)-f_{y}(x,0) \over \Delta x}=1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1de7cb4a84e628797daf914624de99521707daec)
Как видим, для точек прямой
условия теоремы выполняются, и обе смешанные производные равны.
Рассмотрим функцию двух переменных
![{\displaystyle (28)\qquad f(x,y)={|ax+by|^{3} \over {\sqrt {x^{2}+y^{2}}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4a0f4d4c488bee0721a6ca3a4d0fbdbc60ab4c65)
где буквами
обозначены некоторые ненулевые параметры. Формула (28) задаёт непрерывную функцию всюду на плоскости за исключением начала координат
. Мы можем доопределить функцию
в начале координат
![{\displaystyle (29)\qquad f(0,0)=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e353138c70f1e9790d35ff1602ee633b8c424691)
Согласно этим определениям функция будет непрерывной также и в начале координат, что можно видеть, представив формулу (28) в полярной системе координат (и направляя
):
![{\displaystyle (30)\qquad f(r,\phi )=(a^{2}+b^{2})^{3 \over 2}\,r^{2}|\sin(\phi +\phi _{0})|^{3}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d5f4bf48eb04edd22df3ea695e6261139afb5804)
Покажем, что для этой доопределённой функции
смешанные производные в начале координат существуют, но не равны между собой.
Сначала вычислим первые производные
. Как промежуточный результат, заметим, что функция «куб модуля» дважды дифференцируема, и её первая и вторая производные вычисляются по формулам:
![{\displaystyle (31)\qquad {d \over dx}|x|^{3}=3x|x|}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1e8e20dfd68fbb45cefe619359600e582681d9ba)
![{\displaystyle (31a)\qquad {d^{2} \over dx^{2}}|x|^{3}={d \over dx}(3x|x|)=6|x|}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cdb21a32c2930591ed51a80f367c4e4cdb1d0ef2)
Теперь, учитывая (28) и (31), запишем первые производные функции
в точке плоскости, отличной от начала координат (
):
![{\displaystyle (32)\qquad f_{x}=3a{(ax+by)|ax+by| \over r}-{x \over r^{3}}|ax+by|^{3}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/64b0c0ef762b64f2737209f767677bbbf34622e4)
![{\displaystyle (33)\qquad f_{y}=3b{(ax+by)|ax+by| \over r}-{y \over r^{3}}|ax+by|^{3}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7c97e340553421cde4ee9536fc7933217169bc83)
Можно также вычислить первые производные в начале координат, исходя из определения производной:
![{\displaystyle (32a)\qquad f_{x}(0,0)=\lim _{x\rightarrow 0}{f(x,0)-f(0,0) \over x}=\lim _{x\rightarrow 0}{|ax|^{3} \over {x|x|}}=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bcaf9a1ca0f49094b2f948d839644f6e5bd44941)
Аналогично
![{\displaystyle (33a)\qquad f_{y}(0,0)=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c3f93181c549199cc078a0a35dc75348be426040)
Перейдём теперь к вычислению смешанных производных в начале координат:
![{\displaystyle (34)\qquad f_{xy}(0,0)=\lim _{x\rightarrow 0}{f_{y}(x,0)-f_{y}(0,0) \over x}=\lim _{x\rightarrow 0}{1 \over x}\left({3bax|ax| \over |x|}\right)=3ab|a|}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fa351bc70659012c51cfac18631ac22954e83900)
Аналогичное вычисление даёт:
![{\displaystyle (35)\qquad f_{yx}(0,0)=3ab|b|}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5114134c19201d87d90cd629d1331a7008a50d93)
Легко видеть, что формулы (34) и (35) дают разные результаты, если:
![{\displaystyle (36)\qquad |a|>0,\;|b|>0,\;|a|\neq |b|}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5d91edb5e6eeb8429e2d1cd56a49efdd57e86561)
Причина этого неравенства в том, что не выполняется условие теоремы — обе смешанные производные (хотя существуют везде) являются разрывными в начале координат.
Можно также рассмотреть функцию
![{\displaystyle f(x,y)={xy(x^{2}-y^{2}) \over x^{2}+y^{2}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f19471e828667c8c0fb36acd511d698ab6b24d8d)
Аналитическая функция двух переменных (по крайней мере локально) разлагается в сходящийся степенной ряд:
![{\displaystyle (37)\qquad f(x,y)=\sum _{n,m=0}^{\infty }a_{nm}(x-x_{0})^{n}(y-y_{0})^{m}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/562d6844be3f58e474d92a142b8a37c6a2c2ba77)
Как известно, степенной ряд можно дифференцировать почленно в пределах его радиуса сходимости. Таким образом, найдём первые производные:
![{\displaystyle (38)\qquad f_{x}=\sum _{n,m=0}^{\infty }na_{nm}(x-x_{0})^{n-1}(y-y_{0})^{m}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/183e80ab250ba677c3ea141056daf29c7c08530d)
![{\displaystyle (39)\qquad f_{y}=\sum _{n,m=0}^{\infty }ma_{nm}(x-x_{0})^{n}(y-y_{0})^{m-1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5c3b11a923a6f8060bcd0208de477574f290a64e)
Повторное дифференцирование (38) и (39) даёт одну и ту же формулу для обеих смешанных производных:
![{\displaystyle (40)\qquad f_{xy}=f_{yx}=\sum _{n,m=0}^{\infty }nma_{nm}(x-x_{0})^{n-1}(y-y_{0})^{m-1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/10fbfbe0c154cd4112c79cfc8a2530bdae4f6411)